home *** CD-ROM | disk | FTP | other *** search
/ Cream of the Crop 20 / Cream of the Crop 20 (Terry Blount) (1996).iso / virus / cm211.zip / RFC1321.TXT < prev    next >
Text File  |  1996-05-20  |  36KB  |  1,180 lines

  1.  
  2.  
  3.  
  4.  
  5.  
  6.  
  7. Network Working Group                                          R. Rivest
  8. Request for Comments: 1321           MIT Laboratory for Computer Science
  9.                                              and RSA Data Security, Inc.
  10.                                                               April 1992
  11.  
  12.  
  13.                      The MD5 Message-Digest Algorithm
  14.  
  15. Status of this Memo
  16.  
  17.    This memo provides information for the Internet community.  It does
  18.    not specify an Internet standard.  Distribution of this memo is
  19.    unlimited.
  20.  
  21. Acknowlegements
  22.  
  23.    We would like to thank Don Coppersmith, Burt Kaliski, Ralph Merkle,
  24.    David Chaum, and Noam Nisan for numerous helpful comments and
  25.    suggestions.
  26.  
  27. Table of Contents
  28.  
  29.    1. Executive Summary                                                1
  30.    2. Terminology and Notation                                         2
  31.    3. MD5 Algorithm Description                                        3
  32.    4. Summary                                                          6
  33.    5. Differences Between MD4 and MD5                                  6
  34.    References                                                          7
  35.    APPENDIX A - Reference Implementation                               7
  36.    Security Considerations                                            21
  37.    Author's Address                                                   21
  38.  
  39. 1. Executive Summary
  40.  
  41.    This document describes the MD5 message-digest algorithm. The
  42.    algorithm takes as input a message of arbitrary length and produces
  43.    as output a 128-bit "fingerprint" or "message digest" of the input.
  44.    It is conjectured that it is computationally infeasible to produce
  45.    two messages having the same message digest, or to produce any
  46.    message having a given prespecified target message digest. The MD5
  47.    algorithm is intended for digital signature applications, where a
  48.    large file must be "compressed" in a secure manner before being
  49.    encrypted with a private (secret) key under a public-key cryptosystem
  50.    such as RSA.
  51.  
  52.  
  53.  
  54.  
  55.  
  56.  
  57.  
  58. Rivest                                                          [Page 1]
  59.  
  60. RFC 1321              MD5 Message-Digest Algorithm            April 1992
  61.  
  62.  
  63.    The MD5 algorithm is designed to be quite fast on 32-bit machines. In
  64.    addition, the MD5 algorithm does not require any large substitution
  65.    tables; the algorithm can be coded quite compactly.
  66.  
  67.    The MD5 algorithm is an extension of the MD4 message-digest algorithm
  68.    1,2]. MD5 is slightly slower than MD4, but is more "conservative" in
  69.    design. MD5 was designed because it was felt that MD4 was perhaps
  70.    being adopted for use more quickly than justified by the existing
  71.    critical review; because MD4 was designed to be exceptionally fast,
  72.    it is "at the edge" in terms of risking successful cryptanalytic
  73.    attack. MD5 backs off a bit, giving up a little in speed for a much
  74.    greater likelihood of ultimate security. It incorporates some
  75.    suggestions made by various reviewers, and contains additional
  76.    optimizations. The MD5 algorithm is being placed in the public domain
  77.    for review and possible adoption as a standard.
  78.  
  79.    For OSI-based applications, MD5's object identifier is
  80.  
  81.    md5 OBJECT IDENTIFIER ::=
  82.      iso(1) member-body(2) US(840) rsadsi(113549) digestAlgorithm(2) 5}
  83.  
  84.    In the X.509 type AlgorithmIdentifier [3], the parameters for MD5
  85.    should have type NULL.
  86.  
  87. 2. Terminology and Notation
  88.  
  89.    In this document a "word" is a 32-bit quantity and a "byte" is an
  90.    eight-bit quantity. A sequence of bits can be interpreted in a
  91.    natural manner as a sequence of bytes, where each consecutive group
  92.    of eight bits is interpreted as a byte with the high-order (most
  93.    significant) bit of each byte listed first. Similarly, a sequence of
  94.    bytes can be interpreted as a sequence of 32-bit words, where each
  95.    consecutive group of four bytes is interpreted as a word with the
  96.    low-order (least significant) byte given first.
  97.  
  98.    Let x_i denote "x sub i". If the subscript is an expression, we
  99.    surround it in braces, as in x_{i+1}. Similarly, we use ^ for
  100.    superscripts (exponentiation), so that x^i denotes x to the i-th
  101.    power.
  102.  
  103.    Let the symbol "+" denote addition of words (i.e., modulo-2^32
  104.    addition). Let X <<< s denote the 32-bit value obtained by circularly
  105.    shifting (rotating) X left by s bit positions. Let not(X) denote the
  106.    bit-wise complement of X, and let X v Y denote the bit-wise OR of X
  107.    and Y. Let X xor Y denote the bit-wise XOR of X and Y, and let XY
  108.    denote the bit-wise AND of X and Y.
  109.  
  110.  
  111.  
  112.  
  113.  
  114. Rivest                                                          [Page 2]
  115.  
  116. RFC 1321              MD5 Message-Digest Algorithm            April 1992
  117.  
  118.  
  119. 3. MD5 Algorithm Description
  120.  
  121.    We begin by supposing that we have a b-bit message as input, and that
  122.    we wish to find its message digest. Here b is an arbitrary
  123.    nonnegative integer; b may be zero, it need not be a multiple of
  124.    eight, and it may be arbitrarily large. We imagine the bits of the
  125.    message written down as follows:
  126.  
  127.           m_0 m_1 ... m_{b-1}
  128.  
  129.    The following five steps are performed to compute the message digest
  130.    of the message.
  131.  
  132. 3.1 Step 1. Append Padding Bits
  133.  
  134.    The message is "padded" (extended) so that its length (in bits) is
  135.    congruent to 448, modulo 512. That is, the message is extended so
  136.    that it is just 64 bits shy of being a multiple of 512 bits long.
  137.    Padding is always performed, even if the length of the message is
  138.    already congruent to 448, modulo 512.
  139.  
  140.    Padding is performed as follows: a single "1" bit is appended to the
  141.    message, and then "0" bits are appended so that the length in bits of
  142.    the padded message becomes congruent to 448, modulo 512. In all, at
  143.    least one bit and at most 512 bits are appended.
  144.  
  145. 3.2 Step 2. Append Length
  146.  
  147.    A 64-bit representation of b (the length of the message before the
  148.    padding bits were added) is appended to the result of the previous
  149.    step. In the unlikely event that b is greater than 2^64, then only
  150.    the low-order 64 bits of b are used. (These bits are appended as two
  151.    32-bit words and appended low-order word first in accordance with the
  152.    previous conventions.)
  153.  
  154.    At this point the resulting message (after padding with bits and with
  155.    b) has a length that is an exact multiple of 512 bits. Equivalently,
  156.    this message has a length that is an exact multiple of 16 (32-bit)
  157.    words. Let M[0 ... N-1] denote the words of the resulting message,
  158.    where N is a multiple of 16.
  159.  
  160. 3.3 Step 3. Initialize MD Buffer
  161.  
  162.    A four-word buffer (A,B,C,D) is used to compute the message digest.
  163.    Here each of A, B, C, D is a 32-bit register. These registers are
  164.    initialized to the following values in hexadecimal, low-order bytes
  165.    first):
  166.  
  167.  
  168.  
  169.  
  170. Rivest                                                          [Page 3]
  171.  
  172. RFC 1321              MD5 Message-Digest Algorithm            April 1992
  173.  
  174.  
  175.           word A: 01 23 45 67
  176.           word B: 89 ab cd ef
  177.           word C: fe dc ba 98
  178.           word D: 76 54 32 10
  179.  
  180. 3.4 Step 4. Process Message in 16-Word Blocks
  181.  
  182.    We first define four auxiliary functions that each take as input
  183.    three 32-bit words and produce as output one 32-bit word.
  184.  
  185.           F(X,Y,Z) = XY v not(X) Z
  186.           G(X,Y,Z) = XZ v Y not(Z)
  187.           H(X,Y,Z) = X xor Y xor Z
  188.           I(X,Y,Z) = Y xor (X v not(Z))
  189.  
  190.    In each bit position F acts as a conditional: if X then Y else Z.
  191.    The function F could have been defined using + instead of v since XY
  192.    and not(X)Z will never have 1's in the same bit position.) It is
  193.    interesting to note that if the bits of X, Y, and Z are independent
  194.    and unbiased, the each bit of F(X,Y,Z) will be independent and
  195.    unbiased.
  196.  
  197.    The functions G, H, and I are similar to the function F, in that they
  198.    act in "bitwise parallel" to produce their output from the bits of X,
  199.    Y, and Z, in such a manner that if the corresponding bits of X, Y,
  200.    and Z are independent and un